单因素方差分析分析
零假设
Ho 假设:
到 代表 个组的总体均值
示例:
比较 4 种肥料对作物产量的影响
: 肥料 A/B/C/D 组的平均产量完全相同
线性回归视角
模型假设
其中:
:第 组中第 个观测 :总体平均水平 :第 组的效应(组偏差) :随机误差 :行 :列
例如:
| 编号 | A | B | C |
|---|---|---|---|
| I | 4 | 3 | 2 |
| II | 5 | 5 | 4 |
| III | 6 | 5 | 3 |
| IV | 7 | 6 | 5 |
| IIV | 8 | 6 | 9 |
| 组平均 | 6 | 5 | 4.2 |
分解变异(计算平方和)
总平方和(SST):所有数据与总体平均数 的偏差
组间平方差(SSB):组均值与 的偏差(固定效应 )
组内平方和(SSE):组内数据 与组均值 的偏差(反应随机误差 )
上述均满足:
计算均方与 F 统计量
均方
| 来源 | 平方和(SS) | 自由度(df) | 均方(MS = SS/df) |
|---|---|---|---|
| 组间 | SSA | ||
| 组内 | SSE | ||
| 总体 | SST = SSA + SSE | — |
F 统计量
ANOVA 表标准格式
| 变异来源 | 自由度 (df) | 平方和 (SS) | 均方 (MS = SS/df) | F 值 |
|---|---|---|---|---|
| 组间(因素A) | SSA | |||
| 组内(误差) | SSE | — | ||
| 总体 | SST = SSA + SSE | — | — |
结论
要根据 F 分布密度曲线来下结论,一般来说是右侧单尾检验:

如果落在右侧,即否定原假设,认为不完全相同,有可能犯第一类错误,概率为
如果落在左侧,即认可原假设,可以认为这两组完全相同,有可能犯第二类错误
快速计算公式
校正因子(CT)
总平方和(SST)
将每个样本平方,然后减去校正因子(CT),得到所有数据和平均数的偏差
组间平方差(SSB)
同理,可以将